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DETECTION NON INTRUSIVE DES DEFAUTS D'UN 
SIGNAL DE PAROLE TRANSMIS PAR PAQUETS. 
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L 1 invention concerne un procede et un systeme de 
detection non intrusive des defauts d'un signal de parole 
transmis en telephonie sur reseau de transmission par 
paquets . 

Les possibility accrues de joindre et de 
communiquer avec n'iraporte quel interlocuteur en un lieu 
sensibleraent quelcongue du globe terrestre, a un instant 
quelconque et pour un cout derisoire, celui d'une 
communication locale, par' 1 ' intermediaire du reseau 
d 1 interconnexion mondial de 1' Internet, ont suscite un 
engouement pour la telephonie sur reseau de transmission 
par paquets, plus particulierement pour la telephonie sur 

IP (internet Protocol) . 

Contrairement a la telephonie classique sur reseau 
fixe par 1 ' intermediaire du reseau telephonique commute, 
la communication en telephonie sur reseau de transmission 
par paquets, en particulier la telephonie sur IP, presente 
le plus souvent une qualite mediocre en 1' absence de 
garantie d'un niveau de qualite minimum. 

Un tel defaut de garantie de qualite vocale en 
telephonie sur IP est. inherent a la conception meme du 
reseau de transmission, lequel favorise 1 ' interconnexion 
des interlocuteurs au detriment de la bande passante 
finalement allouee au signal de parole, seul un critere de 
tneilleur effort (best effort) en matiere de bande passante 
allouee etant admissible. 
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En particulier, le debit des informations transmises, sous 
forme de paquets numeriques representatif s du signal de 
parole, diminue au fur et a mesure que les usagers du 
reseau IP se connectent et utilisent le reseau en 

5 telephonie sur IP ou non. 

Le deploiement dans des conditions satisf aisantes 
des services de telephonie sur IP necessite done la mise • 
en (Euvre d'un controle de la qualite des services proposes 
et en particulier la mise en oeuvre d'outils de mesure de 

10 cette qualite. 

La notion de qualit6 de' transmission en telephonie 
sur reseau de transmission par paquets repose sur le 
processus de transmission du signal de parole sous forme 
de paquets numeriques representatif s de 1 • information. 
L' information a transmettre est, en effet, decoupee en 
segments de longueur sensiblement identique, pour une 
communication donnee, et ainsi transmise sequentiellement . 

Par exemple, en telephonie sur- IP, les mecanismes 
de routage des paquets transmis sur le reseau Internet 
font que les paquets associes a une meme communication 
telephonique peuvent, le plus souvent, emprunter des 
chemins differents. En consequence, la duree 
d ' acheminement de chaque paquet est variable, car cette 
duree depend du chemin ef f ectivement suivi . 

Af in de pouvoir reconstituer 1 ' information a la 
reception, sur un terminal distant, chaque paquet est 
horodate a 1' emission selon un protocole RTP, pour Real 
Time Protocol. Un programme applicatif implante sur le 
terminal distant reconstitue 1 • information a la reception 
a partir des informations d'horodatage introduites selon 
le protocole RTP. 
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En outre, afin de ne pas encombrer le reseau 
Internet, a chaque paquet est attribue une duree de vie, 
lors de 1' emission. A chaque noeud du reseau Internet tel 
que passerelle ou routeur, cette duree de vie est 
5 decrementee . Lorsque la duree de vie decrementee atteint • 
la valeur zero, le paquet .correspondant est elimine. 

Les principaux defauts d'une transmission en 
telephonie sur IP, encore appelee VoIP, peuvent etre 
mentionnes ci-apres : 
10 - les retards importants , lies aux delais d 1 acheminement 
et aux temps de traitement par les equipements. 
Ce defaut peut gener 1 1 interactivity et done rendre la 
conversation entre appelant et appele difficile, voire 
impossible ; 

15 _ ia gigue dans la duree d 1 acheminement des paquets, ce 
phenomene se traduisant par des intervalles de temps de 
longueur differente entre 1' instant d'arrivee des 
paquets . 

Un tel phenomene se traduit par un temps de 
20 transmission non uniforme ; 

- les pertes de paquets, soit parce que ces paquets ont 
ete elimines lors de 1 1 acheminement , leur duree de vie 
etant epuisee, suite, a 1 ' encombrement des routeurs, 
soit parce q^ils sont arrives au terminal distant avec 

25 un retard trop * important, ces paquets etant alors 

detruits a l'arrivee ; 

- 1 1 echo lie principalement aux retards eleves et 
extremement variables ; 

- la distorsion due au codage du signal de parole en 
30 paquets numeriques a debit reduit, generalement utilise 

en VoIP. 
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Les defauts precites ont un impact reel sur la 
qualite du signal de parole recu et il apparait tres 
important d'estimer cette qualite, tant au niveau 
objectif, par mesure des parametres physiques et 
5 acoustiques de ce signal, que subjectif, a partir de tests 
d'ecoute permettant d' identifier ce qui est ef f ectivement 

percu par les usagers. 

Les outils actuellement disponibles pour assurer 
une telle estimation peuvent etre classes en deux 

10 categories : 

- les outils fonctionnant de bout en bout, ces outils 
suivant la recommandation P 861 de l'UIT-T, serie P. : 
Qualite de la transmission telephonique . Methodes 
devaluation objective et subjective de la qualite. 
Mesure objective de la qualite des codecs vocaux 
fonctionnant en bande telephonique (300-3400 Hz) ; 

- les outils fonctionnant sans intrusion, ces outils 
suivant la recommandation P 561 de l'UIT-T; serie P : 
Qualite de la transmission telephonique. Appareils de 
mesures objectives. Dispositif de mesure en service et 
sans intrusion. Mesure pour les services vocaux. 

Chapitres 6 et 7 . 

Les outils de mesure de bout en bout met tent en 
oauvre des modeles psycho-acoustiques . lis injectent un 
corpus de parole a une extremite et enregistrent le corpus 
transmis a 1 ' autre extremite. Le modele psycho-acoustique 
determine une note de qualite a partir de la comparaison 
entre les caracteristiques temporelles et f requentielles 

* 

du signal source et du signal transmis degrade. Ce type 
d'outil necessite toutefois d' avoir acces aux deux 
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extremites de la liaison telephonique et ne peut etre 
utilise que dans des cas specif iques, limites. 

Les outils de mesure sans intrusion peuvent, par 
con tre , etre connectes en un point quelconque du reseau. 
5 lis fonctionnent au niveau protocolaire, par exemple ■ 
analyseurs de protocole, ou directement au niveau des 
donnees transmises, outils dits I.N.M.D. Les analyseurs de 
protocole fournissent des statistiques sur les types de 
protocole mis en oeuvre sur le reseau, et, en consequence, 
10 une information sur le .type de donnees vehiculees, 
courrier electronique, donnees, voix, les retards, la 
gigue, les pourcentages ' de paquets perdus . Ces 
informations sont obtenues par un decodage des en-tetes 
des paquets ou directement par 1' analyse du signal 
15 numerique lorsque l'outil est connecte a un reseau 
commute. Dans le cas des outils I.N.M.D, la qualite des 
communications est appreciee par 1 ' intermediaire de la 
mesure des parametres de transmission, niveaux de signal 
et de bruit, retard, af f aiblissement d'echo. 
20 Les outils de mesure de bout en bout presentent un 

interet, car ils permettent de qualifier sur une echelle a 
cinq niveaux la qualite d'un reseau, d' un equipement ou 
d'un ensemble d' equipement s . Ce type d'outil implique par 
contre 1' obligation de disposer de deux acces a la ligne 
25 de transmission, I'un en amont et 1 1 autre en aval du 
systeme a qualifier. L'un des acces sert a 1' injection 
d ! un corpus stimulus de mesure, 1 1 autre a 1 ' enregistrement 
du corpus degrade. 

Ce mode operatoire devient un inconvenient redhibitoire, 
30 lorsqu ! un des acces n'est pas accessible, soit par que 
geographiquement eloigne, soit par ce que, dans le cadre 
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de 1 ' interconnexion des reseau, il n'appartient pas a 
l'operateur qui conduit les tests. II ne peut etre mis en 
oeuvre dans le cadre de la telephonie sur reseau de 
transmission par paquets, sauf , le cas echeant, dans des 

cas tres limites. 

Les outils sans intrusion fonctionnent a partir 
d'un seul accis et ne necessitent 1' injection d'aucun 
corpus stimulus. Toutefois, le type des resultats fournis 
par ce type d'outil, tels que des statistiques sur des 
parametfes de transmission, caract^rise le f onctionnement 
du systeme support de cette transmission plutot que la 
qualite du signal de parole transmis. Il est alors 
necessaire d'utiliser des modeles de transfert, tel que le 
modele E de la recommandation G 107 de l'UIT-T, afin de 
pouvoir disposer d'une estimation de la qualite percue a 
partir des caracteristiques de transmission. 

La presente invention a pour objet de rem€dier aux 
insuf f isances et limitations des outils de l'art 
anterieur, notamment dans le cadre de la telephonie sur 
reseau de transmission par paquets. 

En particulier, la presente invention a pour objet 
la mise en ceuvre d'un procede et d'un systeme de detection 
non intrusive des defauts d'un signal de parole transmis 
en telephonie sur reseau de transmission par paquets 
permettant de detecter les defauts perceptibles par les 
usagers directement sur le signal de parole transmis. ■ 

Un autre objet de la presente invention est en 
outre la mise en oeuvre d'un procede" et d'un systeme de 
detection non intrusive des defauts d'un signal de parole 
transmis en telephonie sur reseau de transmission par 
paquets permettant de caracteriser la qualite percue du 
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signal de parole a partir d'une bibliotheque de 
degradations, cette bibliotheque caracterisant les 
defauts, taut d'un point de vue object if par l'energie, le 
spectre, le pitch (frequence f ondamentale) du signal de 
parole, que d'un point de vue subjectif par une definition 
des types de defauts, qualification verbale de ces defauts 
et quantification de la gene provoquee par chaque type de 
def aut . 

Un autre objet de la presente invention est en 
outre la mise en ceuvre d'un procede et d'un systeme de 
detection non intrusive des defauts d'un signal de parole 
transmis en telephonie sur reseau de transmission par 
paquets permettant de determiner une qualite pergue par 

1'utilisateur. 

Un autre objet' de la presente invention est, 
egalement, la mise en ceuvre d'un systeme de detection non 
intrusive des defauts d'un signal de parole transmis, 
permettant, d'une part', de desencapsuler le signal de 
parole contenu dans les paquets, afin de reconstituer 
1 • information vocale, lorsque ce systeme est connecte sur 
une portion de reseau de transmission par paquets, et, 
d' autre part, de recuperer directement le signal de parole 
lorsque ce systeme est connecte sur une portion du reseau 

RTC. 

25 un autre objet de la presente invention est 

egalement, a partir d'un signal de parole reconstitue, la 
mise en oeuvre d'un procede et d'un systeme de detection 
non intrusive des defauts d'un signal de parole transmis 
en telephonie sur reseau de transmission par paquets ou 

30 RTC permettant de detecter les differents types de 
degradation presents sur ce signal de parole, leur duree 
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et leur occurrence, et leur influence sur la qualite 

vocale percue. 

Un autre objet de la presente invention est, 

enfin, la raise en oeuvre d'.un systeme de detection non 
5 intrusive des defauts d'un signal de parole transmis en 
telephonie sur IP permettant de cumuler les avantages des- 
analyseurs sans intrusion et les outils de mesure de bout 
en bout de l'art anterieur, en 1 ' absence de leurs 
inconvenients specif iques. 
10 Le procede de detection des defauts objectifs d'un 

signal de parole transmis par paquets en telephonie sur 
reseau de transmission par paquets, objet de la presente 
invention, est remarquable en ce qu'il consiste, a partir 
d'echantillons d'un signal de parole reconstitu6 
15 representatif de ce signal de parole transmis et analyses 
sur au moins une fen§tre d' analyse: 

- a calculer 1' energie moyenne du signal de parole 
reconstitu6 dans cette fenStre d' analyse, 

- a rechercher, pour une succession de f enetres 
20 d' analyse, les segments du signal de parole reconstitue 

a energie moyenne nulle, et, sur 1' existence d'au moins 
une fenetre d' analyse d' energie moyenne nulle, 

- a valider la perte de paquets avec substitution par des 
trames de silence conditionnellement a 1' existence 

25 d'une substitution de trame . 

Le systeme de detection non intrusive des defauts 
■ d'un signal de parole transmis en telephonie sur reseau de 
transmission par paquets, objet de 1- invention, est 
remarquable en ce qu'il comporte au moins : 
30 - un module de capture et de ■ reconstitution du signal de 

parole reconstitue ; 
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- un module de base de donnees, comportant une 
bibliotheque de signaux de defauts objectifs, lies aux 
caracteristiques physiques du signal de parole, et de 
defauts subject if s, lies au typage de la gene 
occasionnee a des utilisateurs par les signaux de 
defauts objectifs, cette bibliotheque etant construite 
a partir d'une analyse statistique du type de 
degradation ou de def aut present dans le signal de 
parole reconstitue ; 

- un module de detection de defauts presents sur le 
signal de parole reconstitue et en consequence sur le 
signal de parole transmis, et 

- un module de calcul et d'affichage par comparaison des 
defauts objectifs presents sur le signal de parole 
reconstitue aux signaux de defauts objectifs et/ou 
signaux de defauts subjec.tif s de la bibliotheque, 
permettant, a partir d'une analyse statistique du type 
de degradation ou de defaut present dans le signal de 
parole. reconstitue et dans le signal de parole 
transmis, d'afficher des parametres de qualite de ce 
signal de parole transmis. 

Le procede et le systeme objets de 1' invention 
trouvent application a 1 ' amelioration de la qualite des 
communications telephoniques en telephonie sur reseau de 
transmission, par paquets, notamment en telephonie sur IP. 

lis seront mieux compris a la lecture de la 
description et a 1 1 observation des dessins dans lesquels : 
- la figure 1 represente, a titre illustratif, un 
organigramme des etapes essentielles permettant la mise 
en oeuvre du procede objet de la presente invention ; 
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la figure 2a represente un chronogramme d'un 
echantillon de signal de parole et de 1 1 enveloppe de ce 
signal de parole, apres decodage, lorsqu'un tel signal, 
transmis en telephonie sur IP, est affecte d'une perte 
de cinq paquets ; 

la figure 2b represente un chronogramme d ! un 
echantillon de signal de parole, apres decodage de 
1' enveloppe de ce signal de parole et de la derivee de 
cette enveloppe, lorsqu'un tel signal, transmis en 
telephonie sur IP, est affecte d'une double perte de 
cinq paquets ; 

la figure 2c represente un chronogramme des valeurs- de 
la derivee de 1 1 enveloppe d'un signal de parole 
transmis en telephonie sur IP en fonction de 
1 1 emplacement du defaut, perte de paquets, dans 
1 1 echantillon de parole considere ; 

la figure 2d represente un chronogramme d'un 
echantillon de signal de parole dans lequel le 
changement de valeur d'energie aux extremites d'un 
changement de la valeur de 1 1 enveloppe de ce signal de 
parole permet de valider la perte de paquets dans un 
segment d'activite vocale ; 

la figure 3a represente, a titre illustratif, un schema 
synoptique d'un systeme de detection non intrusive des 
defauts d'un signal de parole transmis en telephonie 
sur reseau de transmission par paquets, conforme a 
l'objet de la presente invention ; 

la figure 3b represente, a titre illustratif, un detail 
de realisation d'un module . de capture et de 
reconstitution d'un signal de parole transmis en 
telephonie sur reseau de transmission par paquets 
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incorpore dans le systeme objet de l 1 invention 
represents en figure 3a et permettant d'obtenir un 
signal de parole reconstitue, que le signal de parole 
transmis en telephonie sur reseau de transmission par 
paquets soit analyse au niveau d'un tel reseau ou au 
contraire sur un reseau RTC ; 
- la figure 3c represente, a titre illustratif, une 
architecture de modules logiciels specifiques implantes 
au niveau de 1 'unite centrale du systeme objet de 
1' invention, et permettant la mise en oeuvre de 
1 » ensemble des f onctionnalites du systeme objet de la 
presente invention. 

Une description plus detaillee du procede et du 
systeme -de detection non intrusive des defauts d'un signal 
de parole transmis en telephonie sur reseau de ' 
transmission par paquets, conformes a l f objet de la 
presente invention, sera maintenant donnee en liaison avec 
la figure 1 et des figures suivantes . 

D'une maniere generale, on indique que le procede 
objet de la presente invention, est mis en ceuvre a partir 
d'un signal de parole extrait du reseau de transmission de 
ce signal de parole, ce dernier etant transmis en 
telephonique sur reseau de transmission par paquets. 

De maniere plus specif ique, on indique que le 
25 procede, objet de la presente invention, concerne tout 
signal de parole transmis sous forme de paquets, ce signal 
de parole et les paquets correspondants , supports de ce 
dernier, pouvant etre detectes soit sur un reseau de 
transmission de type reseau local, encore designe par 
reseau LAN, pour Local Area Network, ou sur un reseau 
longue distance, encore designe reseau WAN, pour Wide Area 
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Network, ou tout autre reseau de transmission par paquets, 
-ATM (Asynchronous Transmission Mode) , FR (Frame .Relay) 
notamment-, ou, le cas echeant, sur le reseau telephonique 
commute RTC, ainsi qu'il sera decrit ulterieurement dans 
la description. En reference a la figure 1, le procede 
objet de la presente invention consiste, a partir 
d'echanti lions d'un signal de parole reconstitue, 
representatif bien entendu du signal de parole transmis, a 
effectuer une analyse du signal de parole reconstitue sur 
au moins' une fenetre d' analyse de duree determinee. 

En reference a la figure 1, on considere une etape 
de depart S, dans laquelle on dispose sur la fenetre 
d' analyse Fj, ou j designe 1 • indice de la fenetre 
d' analyse precitee, d'un nombre N d' echanti lions de ce 
signal de parole reconstitue,. chaque echantillon etant 
note x[N.j+i], ou j designe 1 ' indice de la fenetre 
d' analyse et i 1 1 indice de 1 ' echantillon dans la fenetre 

de rang j . ' 

A partir de 1' analyse conduite sur les 

echantillons du signal de parole reconstitue precite, le 
procede, objet de la presente invention, consiste, en une 
etape A, a calculer 1 1 energie moyenne du signal de parole 
reconstitue dans la fenetre d' analyse Fj precitee- La 
valeur de 1' energie moyenne du signal de parole 
reconstitue verifie la relation (1) : 



pplation 1 

' N 



Ej=10.0Log 10 ^]£(x[N.j + i]) 

i=l 
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L 1 etape A precitee est suivie . d'une etape B 
consistant a rechercher, pour une succession de fenetres 
d 1 analyse successives, les segments du signal de parole 
reconstitue dont 1 1 energie moyenne est sensiblement nulle. 
L 1 etape B est representee par une etape de test, le test 
precite consistant a verifier 1 ! existence des segments du 
signal de parole reconstitue precite satisfaisant a la 
relation (2) : 



n 

10 Pplafion 2 



avec Ej = 0 



On comprend en particulier que les segments du signal de 
15 parole peuvent etre constitues par une pluralite de 
fenetres d ! analyse successives. 

L 1 etape B precitee est alors suivie d'une etape C 
consistant a valider la perte de paquets avec substitution 
par des trames de silence conditionnellement a 1" existence 
20 d'une substitution de trames. 

On comprend bien sur que l 1 operation de 
- substitution de paquets perdus par des trames de silence, 
effectuee direct ement par le processus de codage et de 
transmission du signal de parole, constitue 1'un des 
25 defauts objectifs permettant de qualifier le niveau de 
qualite du signal de parole transmis a partir du signal de 
parole reconstitue, conf ormement au procede objet de la 

presente invention. 

Un mode de mise en ceuvre plus specifique de 
1' etape C consistant a valider la perte des paquets avec 
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substitution par des trames de silence conditionnellement 
a 1' existence d'une substitution de trames precedente, 
sera maintenant decrit ci-apres. 

Selon un aspect avantageux de mise en ceuvre du 
procede objet de la presente invention, outre 1 ' etape de 
calcul de l'energie moyenne du signal de parole 
reconstitue dans chaque fenetre d' analyse, et la detection 
de segments du signal de parole reconstitue pour lesquels 
l'energie moyenne est nulle au moyen du test realise a 
1' etape B, un critere supplement aire Ci permet de valider 
la presence d'une perte de paquets substitues par du 
silence apres plusieurs substitutions, par repetition ou 
interpolation avec baisse du niveau d'energie lorsque, par 
exemple, une telle operation est realisee lors du 
processus de decodage du signal de parole. 

Dans ces conditions, 1' etape consistant a valider 
la perte de paquets peut comporter une etape C 1:L ) 
consistant a calculer la pente de decroissance de 
l'energie d' excitation de trames anterieures successives 
sur les fenetres de rang j-3, j-2, les energies 

moyennes correspondantes etant notees Ej. 3 , Ej- 2 et Ej-x 
respect ivement. En effet, c'est la decroissance de 
l'energie des trames ou fenetres substitutes qui precede 
les trames a energie nulle. De facon generale, si la trame 
de rang k est la premiere trame a energie nulle detectee, 
alors, il existe une decroissance d'energie entre les 
trames successives de rang k-n et k- (n-1) , puis 
successivement k-(n-l) et k-(n-2) et ainsi de suite, ou n 
designe le nombre de paquets substitues avec attenuation 
d'energie avant la substitution par du silence. C'est le 
cas du decodeur G 723.1. 
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L 1 etape Cn est ainsi suivie d'une etape C 12 ) 
consistant a valider la pente de decroissance de 1 ' energie 
d 1 excitation determinee a partir du signal de parole 
reconstitue par rapport a la pente de decroissance 
theorique caracteristique du decodeur utilise. 

Dans ces conditions, 1 1 etape Ci 2 ) consiste alors ; 
ainsi que represents sur la figure 1, a effectuer un test 
sur la valeur de la decroissance de pente P precitee, en 
une etape de test C 12 ) . L* etape de test precitee, sur la 
valeur de pente P, consiste a verifier 1 1 appartenance de 
la valeur de la pente P calculee pour chaque valeur 
successive a une plage de valeur de pente selon la 
relation (3) : 

"Relation (3) 

Pe[P 0 ;Po + AP 0 ] 

Sur reponse negative au test Ci 2 ) precite, un 
retour au calcul de 1' energie moyenne du signal de parole 
reconstitue pour chaque fenetre d 1 analyse a 1 1 etape A) est 
effectue. . 

Sur reponse positive au test Ci 2 ) , 1' etape suivante 
C 2 ) consistant a valider la perte de paquets en f onction 
de 1' existence d'un defaut objectif dans un segment 
d f activite vocale peut alors consister a calculer, dans 
une etape C 2 i) , une valeur de changement de la valeur de 
1 1 enveloppe du signal de parole reconstitue, ce changement 
de valeur de 1 1 enveloppe pouvant consister en un calcul de 
1' amplitude de la valeur d f enveloppe EV, ainsi qu r il sera 
decrit ulterieurement dans la description. L 1 etape de 
calcul C 2i ) est alors suivie d'une etape de test C 22 ) 
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consistent a comparer la valeur de changement EV precitee 
a au moins une valeur de seuil . Sur la figure 1, la valeur 
de changement d'enveloppe EV est comparee a une valeur de 
seuil maximale S ma x/ respectivement a une valeur de seuil 
5 minimale S min par comparaison de superiority EV > S maX / 
respectivement d 1 inferiority EV < S min sur le segment de 
parole SG considere. 

Sur reponse negative au test C22) , un retour a 
I'etape A de calcul de 1 1 energie moyenne sur chaque 
10 fenetre d' analyse est realise.. Au contraire, une reponse 
positive a I'etape de test C 2 i) revele IVexistence d'une 
perte de paquets dans un segment d'activite vocale SG 
engendrant un defaut objectif et, en consequence, un 
defaut subjectif, alors que la reponse negative a la 
15 comparaison C 22 ) revele l f absence de defaut subjectif . 

Deux modes de realisation particuliers non 
limitatifs de l'etape de calcul C 2 i) d f un changement de 
valeur sur l'enveloppe du signal de parole reconstitue 
seront maintenant donnes en liaison avec les figures 2a a 
20 2d. 

La figure 2a represente success ivement un 
echantillon du signal de parole reconstitue et la valeur 
de l 1 energie moyenne dans une fenetre d' analyse Fj, ces 
chronogrammes etant representes en niveaux d' energie en 
25 decibels en ordonnees, et en duree . d ' echantillon en 
. secondes en abscisses. 

Li 1 echantillon du signal de parole reconstitue x(t) 
correspond a un signal de parole code selon la norme 

■ 

G 723.1 et degrade par la perte de cinq paquets, puis 
30 traite dans un decodeur G 723.1. On rappelle en 
particulier qu ! une strategie de masquage des erreurs dues 
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a des effacements de trame, c 1 est-a-dire, de perte de 
paquets, peut etre integree dans les decodeurs et, en 
particulier, dans les decodeurs de type G 723.1. Si un 
effacement de trame se • produit, un algorithme de 
5 substitution remplace la trame perdue par une trame de 
silence, par du bruit ou par repetition, ou interpolation, 
en fonction du type de codage utilise et en fonction des 
caracteristiques de la derniere trame regue, activite ou 
absence d'activite de parole, trame voisee ou non- voisee. 
10 Ainsi, en fonction du type de processus de codage/decodage 
utilise en fonction du nombre de paquets perdus et en 
fonction de la position de ces paquets perdus dans le 
signal de parole, les defauts sont pergus de maniere 
differente par les usagers. 
15 Sur la figure 2a, on peut observer que les deux 

premieres trames effacees ont ete substitutes par 
interpolation et diminution du niveau d'energie du signal 
de parole reconstitue, mais que les trois trames suivantes 
n'ont fait l f objet d'aucune interpolation et correspondent 
20 a un signal sensiblement nul . On remarque en outre que 
l»energie est nulle durant un intervalle de temps 
correspondant a trois paquets. 

La mise en ceuvre de 1 1 €tape de calcul d ! un 
changement de valeur sur I'enveloppe du signal de parole 
25 reconstitue, a 1 1 etape C 2 i) et le test C 22 ) , permet en fait 
de localiser 1 1 emplacement du defaut dans le corpus vocal, 
perte de paquets dans un segment de parole ou dans un 
segment de silence. 

Lorsque le defaut apparait dans I 1 activite vocale 
30 proprement dite, ce defaut est pris en compte, car, dans 
ces conditions, ce defaut object if provoque chez 



WO 02/43051 PCT/FR01/03671 



18 



1 'utilisateur une notion de defaut subjectif qui est 
percue comme telle par ce dernier. Lorsqu'au contraire, le 
defaut objectif apparait en dehors de l'activite vocale, 
ce dernier n'a pas d' incidence sur la qualite vocale 
5 percue et il n'est done pas percu comme un d6faut 
subjectif. 

Des ph€nomenes de reverberation et la production 
de la parole par modulation de 1« excitation par les 
conduits vocaux ont pour consequence que 1 ■ arret de 
10 l'activite vocale ou la reprise de cette derniere ne se 
font jamais de facon brutale . Ainsi, 1" amplitude du signal 
de parole, et bien entendu du signal de parole 
reconstitue, ne presente done que des variations 
sensiblemerit continues. La presence d'un defaut dans un 
15 . echantillon de parole, tel que la perte d'un paquet IP 
dans un segment d'activite vocale, engendre done 
automat iquement une rupture dans 1' amplitude du signal de 
parole ou du signal de parole reconstitue. 

La mise en oeuvre des e tapes C 2 i) et C22) a pour 
20 objet de localiser la discontinuite ainsi engendree. 

Selon un premier mode de realisation non limitatif 
de l'etape C 2 i) de calcul d'un changement de valeur sur 
l'enveloppe,. ce changement, e'est-a-dire cette 
discontinuite, peut etre . localise par le calcul de la 
25 derivee de l'enveloppe du signal de parole ou du signal de 

parole reconstitue. 

Dans ce but, le signal de parole reconstitue x(t) , 
e'est-a-dire les echantillons x[N.j+i] peuvent etre soumis 
a un filtrage passe-bas delivrant l'enveloppe du signal de 
30 parole reconstitue y(t) correspondant sensibletnent a 
1' amplitude du signal de parole reconstitue. 
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La valeur de la derivee du signal de parole 
devient alors importante, lorsque 1 1 amplitude du signal de 
parole presente une discontinuity . C'est en particulier le 
cas aux extremites d'un segment de parole correspondant a 
5 un defaut avec substitution par du silence. 

En ce qui concerne le calcul de I 1 amplitude du 
signal de parole reconstitue, et finalement de l'enveloppe 
de ce dernier, ce calcul peut etre effectue par segments. 
Ainsi, une valeur' de 1' amplitude et de l'enveloppe 
10 precitee peut etre determinee pour chaque fenetre 
d' analyse. L'energie moyenne de chaque trame est en 
consequence une representation de l'enveloppe du signal de 
parole reconstitue et done du signal de parole. 

Sur la figure 2b-, on a represents successivement 
15 un echantillon du signal de parole reconstitue, l'energie 
moyenne dans la fenetre d 1 analyse exprimee en dB et, 
enfin, la derivee de l'enveloppe du signal de parole 
reconstitue, egalement exprimee en dB. L 1 echantillon du 
signal de parole correspond a un echantillon code, selon le 
20 processus de codage/decodage G 723.1 degrade par deux 
pertes de cinq paquets, puis traite par un decodeur 
G 723.1- La premiere perte de paquets IP intervient dans 
un segment d'activite vocale, tandis que la deuxieme perte 
de paquets IP intervient dans un segment de non-activite 
25 vocale . De la meme maniere que dans le cas de la. figure 
2a, on constate que les deux premieres trames effacees ont 
ete substitutes par ' interpolation de la derniere trame 
regue et que les trois trames suivantes n'ont fait I'objet 
d 1 aucune interpolation (elles ont ete substitutes par du 
30 silence), et cela pour les deux defauts. 
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On note egalement que 1 ' energie de 1 • echantillon 
du signal de parole, echantillon vocal, est nulle durant 
un intervalle de temps correspondant a trois paquets . 

En outre, on constate egalement que le module de 
la derivee de 1 ' enveloppe prend des valeurs importantes 
lors du passage de la deuxieme a la troisieme trame du 
defaut, ainsi qu'au passage de la derniere trame du defaut 
a la nouvelle trame correctement recue. 

Des investigations par des tests de la detection 
de defauts simules ont montre qu'il existe une valeur de 
seuil S au-dessus de laquelle le module de la derivee de 
1 - enveloppe du signal de parole reconstitue valide en fait 
le critere d'une perte de paquets avec substitution par 
des trames de silence, conditionnellement a 1' existence 

d'une substitution de trame. 

Le calcul de la derivee de 1 • enveloppe du signal 
de parole, ou du signal de parole reconstitue, permet, en 
reference a la figure 2c, d' identifier 1 1 emplacement du 
defaut objectif dans le corpus vocal. En effet, en 
reference a la figure 2c precitee, on constate que les 
valeurs de la derivee aux extremites du defaut sont plus 
faibles lorsque la degradation intervient en 1 • absence 
d'activite vocale, c'est-a-dire dans une zone de silence. 
On peut ainsi constater, au niveau de la figure 2c 
precitee, 1' existence d'un ecart de 30 a 40 dB sur la 
valeur de la derivee en fonction de la position du defaut, 
lorsque ce defaut correspond a un segment d'activite 
vocale ou, au contraire, a un segment exempt d'activite 
vocale . 

Ainsi, lorsque, en reference a la figure 2c, le 
defaut introduit dans 1 ■ echantillon de parole est une 
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perte de cinq paquets, les valeurs de la derivee de 
I'enveloppe du signal de parole correspondent sur la 
figure precitee a la transition de fin du defaut, nouvelle 
trame correctement regue . -La difference d' amplitude au 
niveau du module de la derivee du signal de parole ou du 
signal de parole reconstitue en fonction de 1 1 emplacement 
du defaut objectif dans 1 » echantillon de parole considere, 
met ainsi en evidence la possibility de detecter dans 
quelles conditions d'activite vocale se situent les 
transitions, derniere trame regue - apparition du defaut 
et apparition du defaut - nouvelle trame re?ue . 

Toutefois,. la valeur de seuil S liee a la methode 
d' extraction de I'enveloppe du signal de parole doit en 
fait etre calibree en fonction des equivalents pour la 

sonie a l 1 emission. 

On rappelle que la sonie a I 1 emission designe 
l'efficacite du passage de 1 ? onde acoustique au signal de 
parole electrique. 

Afin de se demarquer de la dependance par rapport 
20 aux equivalents pour la sonie des terminaux a 1" emission, 
un deuxieme mode de mise en oeuvre de 1 1 etape de calcul de 
changement de valeur sur I'enveloppe C 2 i) et du test C 22 ) 
peut etre propose, ainsi qu ! il sera decrit en liaison avec 
la figure 2d, 

25 Ainsi que represents sur la figure precitee, le 

signal de parole ou signal de parole reconstitue et, en 
particulier, le signal d'enveloppe exprime en dB en 
fonction du temps, presente une variation d'energie 
significative aoxx extremites de chaque trame substitute 

30 par du silence dans la zone d'activite vocale. Cette 
variation d'energie aux extremites permet alors de 
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s'affranchir de la dependance du reglage du terminal 
emetteur, c'est-a-dire de la dependance a l'efficacite du 
transducteur d f emission et aux reglages audio du terminal 
utilise, ' ainsi que precedemment mentionne dans la 
5 description relativement a la methode consistant a 
calculer la derivee de l'enveloppe du signal de parole. 

Dans le mode . de realisation considere 
correspondant a la figure 2d, 1 ' utilisation d'un 
algorithme de detection d'activite vocale permet de 
10 s'affranchir du reglage du terminal demission, Ce type 
d' algorithme determine un seuil d> amplitude ou d'energie 
permettant de trongonner 1 ' echantillon de parole en 
segments d'activite vocale et en segments de non-activite 
vocale. La determination de ce seuil est independante du 
15 reglage du terminal d 1 emission. On discrimine les defauts 
situes dans des tron?ons d'activite vocale, en comparant 
1'energie de .la derniere . trame reqrue avant le defaut et 
l'energie de la premiere trame re?ue apres le defaut, au 
seuil determine par 1 ' algorithme precite. Si les energies 
20 sont superieures au seuil, alors le defaut s'est produit 
en pleine activite vocale. Par contre, si les energies 
sont inferieures au seuil, alors le defaut s'est produit 
en l 1 absence d'activite vocale. 

Enfin, l'etape C 3 ) de validation de perte de 
25 paquets dans un segment de parole permet ensuite 
d ! attribuer une note de" qualite a la communication suivant 
1 T existence d'un tel defaut. 

Une description plus detaillee d'un systeme de 
detection non intrusive des defauts d'un signal de parole 
30 transmis en telephonie sur reseau de transmission par 
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paquets, conforme a l 1 objet de la presente invention, sera 
maintenant donnee en liaison avec les figures 3a a 3c. 

D'une maniere generale, on rappelle, en reference 
a la figure 3a, que le systeme objet de la presente 
5 invention est adapte aux fins de fonctionner directement a 
partir du signal de parole, de maniere a determiner une 
qualite perdue par 1 1 utilisateur . Ainsi, le systeme 
precite met en .ceuvre un dispositif permettant de 
desencapsuler le signal de parole contenu dans les paquets 
10 afin de reconstituer 1 1 information -vocale lorsque le 
systeme objet de 1' invention est connecte sur un reseau de 
transmission par paquets,. ou le cas echeant, de recuperer 
directement le signal vocal lorsque le systeme objet de 
1' invention est connecte sur une portion de transmission 
15 du reseau telephonique commute. 

Une fois que le signal de parole est reconstitue, 
selon un signal de parole reconstitue representatif de ce 
signal de parole, un traitement de signal approprie 
detecte les differents types de degradation presents dans 
20 le signal de parole considere, ainsi que leur duree et 
leur occurrence. Ces defauts sont ensuite relies, a une 
influence sur la qualite vocale pergue dans les conditions 
qui seront explicitees ci-apres. 

En reference a la figure 3a, le systeme de 
25 detection, objet de la presente invention, comporte un 
module 1 de capture et de re constitution du signal de 
parole transmis par paquets, ce module 1 delivrant un 
signal de parole reconstitue, note spr . 

En outre, ainsi que represents sur la figure 3 a 
30 precitee, le systeme objet de 1 1 invention comprend une 
base de donnees, portant- la reference 2 et representee 
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symbol iquement par un disque dur HDD, cette base de 
donnees comportant une bibliotheque de signaux de defauts 
objectifs lies aux caracteristiques physiques du signal de 
parole, et bien entendu du- signal de parole reconstitue 
spr, et de defauts subjectifs lies au typage de la gene 
occasionnee a des utilisateurs par les signaux de defauts 
objectifs. 

D'une maniere plus specif ique, on indique que la 
bibliotheque est construite a partir d'une analyse 
statistique du type de degradation ou de defaut present 
dans le signal de parole reconstitue spr dans les 
conditions qui seront explicitees de maniere plus 
detaillee ultSrieurement dans la description. 

.En outre, ainsi que represents sur la figure 3a 
precitee, le systeme objet de 1 1 invention comprend un 
module 3 de detection des defauts presents sur le signal 
de parole reconstitue spr et, en consequence, sur le 
signal de parole transmis sp. Sur la figure 3a precitee, 
les modules constitutifs du systeme de detection non 
intrusive, objet de la presente invention, const itues 
essentiellement par des modules logiciels, sont 
representes de maniere. symbolique par un ovale, afin de 
distinguer ces modules des modules materiels constitutifs 
du systeme objet de la presente invention. 

En outre, un module 3 de calcul et d'affichage par 
comparaison des defauts objectifs presents sur le signal 
de parole reconstitue spr aux signaux de defauts objectifs 
et/ou aux signaux de defauts subjectifs contenus dans la 
bibliotheque des defauts, permet, a partir d'une analyse 
statistique du type de degradation ou de defaut present 
dans le signal de parole reconstitue spr et dans le signal 
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de parole transmis sp, d'afficher des parametres de 
qualite du signal de parole transmis sp . 

En reference a la figure 3a, on indique que, apres 
detection des types de dSfauts par le module 3 de 
detection de def auts presents sur le signal de parole 
reconstitue spr, on dispose en fait de variables de types 
de def auts, notees tdf, lesquelles sont comparees aux 
signaux de def auts objectifs et/ou subjectifs de la 
bibliotheque, ces signaux etant notes tdfb au niveau du 
module 4 de calcul et d'affichage par comparaison des 

def auts objectifs. 

Ainsi que represents sur la figure 3a, on comprend 
bien entendu que pour assurer le calcul et l f affichage par 
comparaison des def auts objectifs precites, le module 4 de 
calcul comprend avantageusement un module logiciel 4a 
assurant le traitement de comparaison entre les valeurs de 
type de def auts tdf et les signaux de def aut de la 
bibliotheque tdfb, ce module logiciel 4a etant bien 
entendu associe a une unite de calcul 4b, comportant une 
unite centrale UC de traitement et bien entendu une unite 
d ! affichage notee UF. 

Ainsi, le systeme de detection non intrusive de 
def auts d'un signal de parole, objet de la presente 
invention, peut etre realise a partir du module de capture 
et de reconstitution du signal de parole reconstitue spr, 
constitue par un module materiel de capture et de 
reconstitution, lequel peut alors etre interconnects par 
1 1 intermediaire d'une liaison numerique a un micro- 
ordinateur de type PC par exemple, ou a un calculateur 
dedie a base de processeurs de traitement de signal DSP. 
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La realisation du systeme objet de la presente 
invention sur un materiel informatique de type ordinateur 
PC presente 1 ' interet d'une grande souplesse de mise en 
(Euvre, dans la mesure ou, bi'en entendu, les modules 3 et 4 
de detection des types de def aut et de calcul par 
comparaison peuvent etre constitues par des programmes 
directement implantes en memoire morte, ou non volatile, 
de 1 ' ordinateur et charges en memoire de travail lors du 
traitement . 

Une description plus detaillee du module 1 de 
capture et de reconstitution du signal de parole transmis 
en un signal de parole reconstitue spr sera maintenant 
donnee en liaison avec la figure 3b. 

D'une maniere generale, pour realiser la mise en 
ceuvre du module 1 de capture et de reconstitution du 
signal de parole transmis, il est necessaire de tenir 
compte du fait que le systeme objet de la presente 
invention doit etre alimente par le signal de parole 
. transmis par paquets extraits, soit du reseau de 
transmission numerique, soit a partir du reseau 

telephonique commute . 

Dans le cas d'un reseau local de type LAN, pour 
Local Area Network, ou d'un reseau longue distance de type 
WAN, pour Wide Area Network, ou de tout autre type de 
reseau de transmission par paquets (ATM, FR, GSM) servant 
de support a tout signal de parole emis sous forme de 
paquets, le module 1 de capture et de reconstitution 
comporte un analyseur de protocole 1 0 , ainsi que 
represents sur la figure 3b, permettant de capturer et de 
desencapsuler la voix pour la restituer sous forme de 
signal de parole reconstitue spr. Dans ces conditions, la 
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conversation entre les usagers de deux terminaux peut 
alors etre enregistree sous forme de fichier, fichier 
binaire ou fichier son, ou transferee directement au 
systeme objet de 1 1 invention. 
5 Dans le cas d'une installation du systeme objet de 

la presente invention sur une portion de reseau 
telephonigue commute, reseau RTC, le signal de parole peut 
alors etre directement accessible par 1 1 intermediate 
d ! une sonde l x a haute impedance, connectee au niveau 
10 d'une liaison numerique a quatre fils par exemple . 

L ! extraction du signal de parole, a partir du 
signal de parole transmis, pour engendrer le signal de 
parole reconstitue spr, peut alors etre realisee par 
differents systemes suivant le type de connexion au 
15 reseau, c'est-a-dire la connexion par 1 1 intermediaire de 
I'analyseur de protocole 1 0 , ou respectivement la 
connexion par 1 1 intermediaire de la sonde a haute 

impedance li- * 

En ce qui concerne le processus de 
20 desencapsulation de la voix, ce processus peut etre mis en 
oeuvre dans le cas de la connexion de I'analyseur de 
protocole 1 0 par un programme \ applicatif de 
desencapsulation, c'est-a-dire xin programme utilisant les 
memes processus de codage/decodage, definis par exemple 
25 " selon les normes G 723.1, G 729, G 711 et autres, que les 
terminaux ou passerelles du reseau. 

Dans ces conditions , 1 1 echantillon de parole 
preleve par I'analyseur de protocole 1 0 est done 
sensiblement identique au corpus vocal que restituerait un 
30 terminal place au meme endroit que I'analyseur de 
protocole 1 0 dans le reseau considere. Dans ces 
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conditions, 1 ' echantillon ainsi produit par l'analyseur de 
protocole 1 0 comprend bien entendu le signal de parole 
affect^ des defauts dus a la transmission et, en 
particulier, de la perte des paguets d 1 information ou a 
' 1 1 introduction de bruit ambiant a 1 1 extremite d' emission 

" du signal de parole sp . 

Dans le cas d'un raccordement de la sonde a haute 
impedance l x au reseau telephonique commute RTC, le signal 
de parole sp est directement accessible sous forme de 
trames MIC a 64 kbits et 1* operation de desencapsulation 
de la voix n'est .alors pas necessaire. Qn dispose ainsi du 
signal de parole reconstitue spr directement a partir de 
la sortie de la sonde a haute impedance. 

•Une description plus detaillee du module 2 
constitutif de la base de donnees comportant ' la 
bibliotheque de signaux de defauts objectifs sera 
maintenant dpnnee ci-apres. 

D'une maniere generale, on indique qu'une 
classification des degradations ou defauts presents sur le 
signal de parole est realisee en relation avec la 
perception de ces defauts par un ou plusieurs usagers . On 
obtient ainsi une bibliotheque de types de degradations 
per<?ues. La bibliotheque des defauts precitee est ainsi 
obtenue grace a une etude subjective reposant sur des 
tests d'ecoute par un groupe d 1 usagers utilisant la 
methode de categorisation libre. Pour obtenir la 
bibliotheque des defauts precitee, 1 1 on procede a une 
audition par un ensemble de sujets d'un certain nombre de 
signaux vocaux, constitues par des echantillons de parole 
affectes par une perte de paquets et qu'ils doivent 
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regrouper entre enx lorsque la degradation leur setnble 
sensiblement identique. 

II est alors demande aux sujets procedant a 
1' audition de qualifier, c" 1 est-a-dire de verbaliser les 
5 groupes de defauts pergus . 

Parmi les defauts pergus par les sujets precites, 
I'un des defauts qui ressort le plus clairement est celui 
qui est qualifie de coupure. II s " agit d'une perte de 
paquets IP avec substitution par une ou plusieurs trames 

10 de silence. 

La bibliotheque des defauts a ainsi pour objet 
d'assurer une classification des differents types de 
defauts objectifs presents sur le signal de parole 
reconstitue spr, et done sur le signal de parole sp, en 
fonction des types de decodeurs utilises et bien entendu 
les conditions de presence ou d' absence, generation 
discontinue, de trame designee par DTX, selon la 
terminologie habituelle. A ces types de defauts objectifs, 
sont associes des types de defauts subject if s ainsi que 
represents par exemple dans le tableau ci-apres : 



20 
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DEFAUTS SUBJECTIFS 



TESTS 


GROUPES 


GENE 




Codeur : G723.1 


■■ Degradations non per9ues 




1 


Debits : 6.3 kbits/s 


* Counures 






DTX : Present 


■ Metalliaues ■ voix de robots* metalliaues+ 






Voix : Femme 


resonances et attenuations moins electroniaues 








■ Fortes attenuations et resonances 


JK-id i 

* 1 *T 1 




* 


■ Voix deformees ! 


Ki 5 




Codeur : G723.1 


■ Degradations non percues 


K21 




Debits : 6.3 kbits/s 


■ Cououres et baisse d'enereie ! 


K22 I 


2 


DTX : Present 


■ Metalliaues et metalliaues avec bins 


K-?^ 1 




Voix : Homme 


■ Metalliaues (tres robot") 






Codeur : G723.1 


f 

■ Decrradations non nercues 

i/vu uUttLIVliu null u/\^Ay**wo 


K31 




Debits : 6.3 kbits/s 


■ Bin aitm strident 


i K.^? t 


3 


DTX : Absent 


■ Metalliques, legers gresillements 


K33 




Voix : Homme 










■ Surle mot "planning" 


K35 




• 


■ Counures 


K36 1 

1 w 1 






B DeoTadations non nercues 


i le* 1 i 




Codeur : G723.1 


■ Etouffement du mot, baisse de volume et saut 






Debits : 6.3 kbits/s 


dans la parole 




4 


DTX : Absent 


■ Baisse d'energie, presque une coupure 






Voix : Femme 


■ Bips, bruits parasites, bruits de fond et une 


K44 j 






baisse d'energie 








■ Metallique avec une baisse d'energie et des sons 


K45 | 






parasites 






Codeur : G729 


■ Degradations non percues 






Debits : 8 kbits/s 


■ Voix deformees et baisse d'intensite 




5 


DTX : Absent 


* Sur le mot "entrainer" (accentuation sur V et 


K53 




Voix : Femme 


"tr") 








■ Coupures 


K54 



r 
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TESTS 


GROUPES 


GENE 








LJCgl aUdUUZio HUH pciyUCo 


K6i 








jLegeres coupures, voire ue iones diicnudiiuiio 






Codeur : G729 




{swt le mot gare j 




6 


Debits : 8 kbits/s 




Soufflement, voix bruitee (comme si on soufflait 


K^3 




DTX : Absent 




dans un micro) 




1 


Voix : Homme 




Coupures 


K^4 








licS JLOITCo d-ilCIlUallUXlo, picot£UC uco uuupuiw 










r^mmnrpc cnr If* mot "riPTtnTHation" 
v>uupuicb oUi ic niui jjci iuj. uauun 




I 






T fsnprc /afTptQ mptiaHinnp^ avpc des attenuations 






Codeur : G729 




l^egraaations non per9ues 


K71 




Debits : 8 kbits/s 




j^egeres attenuations aveo uca micn-ci cut/c^, 


K72 


7 


DTX : Present 




*-r-T-ar<-i 1 1 r-x-m ort+r sloe oahO +t»p»C IrrfMIll 1 /^Q f*\ Z.CW~\T(\ Q 

gresillements, ues sons irco oiuumco ci &umua 


K73 s 




Voix : Homme 




Fortes attenuations 








Attenuations avec ue l ecno, ues mienerences 


K74 1 




• 




Coupures 


K75 




■ 




lj cgi auaiiuns nun pcryucb 










/^Aiinnrpc • rntir+pe tntprnmHnn^ pf coil tc Hanc I c\ 
V_/UlipurCj . tUul LCo 1111C11 LiI*/ll\Jllo t<L oau.to ucuio iu 


K82 




Codeur : ij/Zy 




paroic 


K83 




Debits : 8 kbits/s 




Coupures 


8 


DTX : Present 




v^oupures avec ou Druiij uet> Lacpiiciij.cu.io 






Voix : Femme 




Fortes attenuations 


K85 










Ks6 j 








T\mtt^ Qiinnlementaire^ * bruits de souffle et 


K-87 






# 


OTPC 1 1 1 f»m PTI t*% 
fdyl C jlAlCxiAWAHO 






Codeur * G723.1 


■ 


Degradations non per9ues 


K91 




Debits : 5.3 kbits/s 


■ 


Fortes attenuations, voire coupures 


K92 


9 


DTX : Absent 


■ 


Metalliques, gresillements 


K93 




Voix : Femme 


■ 


Legers gresillements et bips (sur les mots 


K94 








"perturbation" et "gare") 








■ 


Attenuations et etouffement 


K95 




Codeur : G723.1 




Degradations non per9ues 






Debits : 5.3 kbits/s 


■ 


Baisse d'energie souffle 


Kt02 j 


10 


DTX : Absent 


■ 


Baisse d'energie 


KlQ3 




Voix : Homme 


■ 


Voix deformee, un peu metallique 


K104 j 






■ 


Metallique, robot, bip. 


K-105 
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A 1 1 observation du tableau precite,. on constate 
que la bibliotheque des defauts permet de mettre en 
evidence des defauts subjectifs tres differents pour des 
defauts objectifs correspondant a des pertes de paquets 
5 remplaces par interpolation puis par du silence, c'est-a- 
dire pour des defauts objectifs correspondant au meme 
processus de r emplacement des paquets perdus par 
interpolation puis par des trames de silence dependant 
notamment du type de codeurs utilises, du debit de 
10 transmission, de la presence ou de 1" absence de DTX, du 
sexe du locuteur et certainement * en fonction de la 
position de la degradation dans le signal de parole. 

Ainsi, la bibliotheque de defauts subjectifs 
comport e des groupes de defauts perdus categorises et 
15 qualifies par une pluralite d 1 utilisateurs de reference 
soumis a 1 1 ecoute de signaux de parole de test affectes de 
perte specif ique de paquets. 

De preference, les groupes de defauts, tels que 
representes au tableau precite, peuvent en outre etre 
20 soumis a une procedure de quantification de la gene pergue 
permettant d'engendrer une grandeur de quantification de 
gene . 

En ce qui concerne le module 3 de detection des 
types de defauts, on indique que le module logiciel 
25 precite peut comprendre avantageusement des sous -modules 
de detection permettant la mise en oeuvre du precede objet 
de la presente invention, tel que represents en figure 1 
precedemment decrite. 

Ainsi, le module 3 de detection des types de 
30 defauts assure la detection dans le signal, de parole 
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reconstitute spr des paquets. perdus et remplaces par du 
silence. 

Le module precite peut correspondre aux 
differentes etapes de la figure 1 et comporter un sous- 
5 module de calcul de I 1 energie- moyerme du signal de parole 
reconstitue dans chaque f enetre d 1 analyse, selon 1 1 etape 
A, un sous-module de detection de chaque f enetre d 1 analyse 
dont 1 1 energie . dans cette f enetre de rang j est 
sensiblement nulle, ainsi que represents a 1 1 etape B de la 

10 f igrure 1 . 

En outre, le module 3 precite peut comporter un 

sous-module de detection de la decroissance de 1 1 energie 
du signal de parole reconstitue spr precedant le 
remplacement par des trames de silence. Ce sous-module 
15 correspond sensiblement aux etapes Cn) et C i2 ) de la 
figure 1. 

Enfin, le module 3 de detection des defauts 
presents sur le signal de parole reconstitue peut bien 
entendu comporter, en outre, un sous -module de 

20 localisation du defaut dans le corpus du signal de parole, 
dans un segment de parole ou dans un segment de silence, 
conformement aux operations realisees a 1 1 etape C 2 i) de 
calcul d f un changement de valeur sur 1 1 enveloppe du signal 
de parole precite, suivi du test C 22 ) de comparaison de 

25 cette valeur de changement a une valeur de seuil, seuil 
maximum ou seuil minimum, ainsi que deer it precedemment 

dans la description. 

On rappelle que, dans certains cas, le sous -module 
de calcul d'un changement de valeur sur 1 ' enveloppe a 
30 l 1 etape C 2i ) peut etre remplace par le calcul de la 
derivee de 1 1 enveloppe du signal de parole. 
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On rappelle egalement que la localisation du 
defaut dans le corpus du signal de parole, dans un segment 
de parole ou dans un segment de silence," peut etre 
realisee a partir de la- valeur de la derivee de 
1'enveloppe du signal de parole, ainsi que represents 
precedemment dans la description en liaison avec la figure 

2c. 

On rappelle enfin que 1' ensemble des etapes de 
mise en oeuvre du procede objet de 1' invention au moyen des 
modules 'logiciels precites, et finalement du module 3 de 
detection des types de defauts, permet de valider la perte 
de paquets dans des segments de parole a 1 • etape C 3 ) et 
finalement de disposer des variables de type de defauts 
tdf, lesquelles sont utilisees par le module de calcul et 
de comparaison vis-a-vis des valeurs de defauts contenus 
dans la bibliotheque, dans les conditions qui seront 

explicitees ci-apres. 

D'une maniere generale, on indique que le module 
de calcul 4, constitue par le module 4a de calcul et de 
comparaison des types de defaut tdf et des valeurs de 
defaut de la bibliotheque tdfb, associe bien entendu a 
1' unite centrale de calcul UC et a 1' unite d'affichage UF 
du micro-ordinateur 4b, permet d'afficher des parametres 
de qualite du signal de parole transmis par la mise en 
ceuvre de sous -modules logiciels, iesquels sont illustres 
de maniere non limitative en figure 3c. 

Ainsi que represents sur la figure precitee, le 
module 4a de calcul et de comparaison peut comporter 
avantageusement un sous-module 4a x d* identification et de 
quantification de la gene des defauts detectes par 
comparaison. 
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A titre d'exemple non limitatif, on indique que, 
par comparaison des types de defauts objectifs tdf. et des 
valeurs de defauts de bibliotheque tdfb, lorsque la 
comparaison est reussie, on- obtient, a partir du tableau 
5 precedemment mentionne dans la description, non seulement 
le type de defauts subjectifs precedemment cite mais 
egalement la valeur de gene relative obtenue a partir de 
la qualification par les sujets soumis a l'audition des 
defauts. On rappelle que dans le tableau precite, les 
10 valeurs "de gene relative sont notees : 

- Kn a K 15 pour le test de defaut numero 1 ; 

- K 2 i a K 24 pour le test numero 2 ; 

- K 3i a K 36 pour le test numero 3 ; 

- K4i'a K45 pour le test numero 4 ; 
15 - K 51 a K 54 pour le test numero 5 ; 

- Ksi a K 68 pour le test numero 6 ; 

- K 7 i a K75 pour le test numero 7 ; 

- Ksi a K 87 pour le test numero 8 ; 

- K 9 i a K 95 pour le test numero 9 ; 
20 - K 101 a K105 pour le test numero 10. 

Ces valeurs de gene relative sont des valeurs qui peuvent 
etre etablies par les sujets soumis a I 1 audition sur une 
echelle de valeurs specif ique. 

Le sous -module 4a x .peut alors etre suivi d f un 

25 sous-module 4a 2 permettant de calculer, d'une part, 
1 'occurrence du defaut considere et, d'autre part, la 
duree de ce defaut objectif. Le sous-module 4a 2 permet, & 
partir des valeurs de gene relative precedemment obtenues, 
de quantifier la gene effective a partir de la duree et de 

30 1' occurrence des defauts,. 
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Le sous-module 4a 2 peut lui-meme etre suivi d'un 
sous-module 4a 3 devaluation de la perception des defauts 
en fonction de leur emplacement. 

Alors que 1 1 emplacement du defaut a pu etre etabli 
5 a partir du module 3 precedemment deer it de detection des 
types de defaut, le module 4a 3 peut consister en un module 
statistique prenant en compte un effet de rescence mis en 
evidence a partir d'un ensemble de sujets soumis a une 
audition des defauts consideres, en fonction de la 
10 position de ces defauts dans 1 1 echantillon vocal. 

En effet, lors de 1 1 etablissement du jugement 
global, les • derniers instants de la sequence sont plus 
influents, conformement a 1 1 effet de rescence. L 1 impact 
des degradations est ainsi pondere en fonction de 
15 1 ' emplacement de ces defauts dans la sequence. 

D'une maniere generale, on rappelle que le modele 
statistique correspondant peut etre mis en ceuvre a partir 
d'un ensemble d f auditeurs pour des positions de defaut, 
e'est-a-dire de suppression de paquets remplaces par 
20 interpolation puis par du silence intervenant , soit au 
debut, soit au milieu ou encore a la fin des segments de 
signaux de parole consideres. 

Enfin, le sous-module 4a 3 est suivi d'un sous- 
module 4a 4 d' estimation de la qualite vocale du signal de 
25 parole transmis., a partir bien entendu du signal de parole 

reconstitue spr. 

Le sous-module 4a 4 d l estimation de la qualite 
vocale comporte en fait un logiciel de conversion des 
parametres de 1 ' occurrence et de duree des defauts en un 
30 parametre de qualite vocale per?ue. 
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RE VEND X CAT IONS 

1. Systeme de detection non intrusive des defauts 
d f un signal de parole transmis en telephonie sur reseau de 
transmission par paquets, caracterise en ce qu'-il comporte 
au moins : 

des moyens de capture et de reconstitution dudit 
signal de parole transmis delivrant un signal de 
parole reconstitue ; 

des moyens de base de donnees comportant une 
bibliotheque de signaux de defauts objectifs, ■ lies aux 
caracteristiques physiques du signal de parole, et de 
signaux de defauts subjectifs, lies au typage de la 
gene occasionnee a des utilisateurs par lesdits 
signaux de defauts objectifs, ladite bibliotheque 
etant construite a partir d'une analyse statistique du 
type de degradation ou de defaut present dans le 
signal de parole reconstitue ; 

des moyens de detection de defauts presents sur ledit 
signal de parole reconstitue et en consequence sur 
ledit signal de parole transmis ; 

des moyens de calcul et d ! affichage par comparaison 
des defauts objectifs presents sur ledit signal de 
parole reconstitue auxdits signaux de defaut objectifs 
et/ou signaux de defauts subject if s de la bibliotheque 
permettant, a partir d'une analyse statistique du type 
de degradation ou de defaut present dans le signal de 
parole reconstitue et dans le signal de parole 
transmis, d'afficher des parametres de qualite dudit 
signal de parole transmis. 

2. Systeme selon la revendication 1, caracterise 
en ce que ledit signal de parole transmis en telephonie 
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sur reseau de transmission par paquets etant reconstitue a 
partir d ! un reseau local ou d'un reseau longue distance, 
lesdits moyens de capture et de reconstitution dudit 
signal de parole comprennent un analyseur de protocoles 
permettant de capturer et de desencapsuler le signal de 
parole a partir des paquets transmis, ledit signal de 
parole capture et desencapsule etant memorise pour 
constituer ledit signal de parole reconstitue. 

3. Systeme selon la revendication 1, caracterise 
en ce que ledit signal de parole transmis en telephonie 
sur reseau de transmission par paquets etant decode, 
achemine et reconstitue a partir du reseau telephonique 
commute, lesdits moyens de capture et de reconstitution du 
signal de parole comprennent une sonde a haute impedance 
connectee a une liaison numerique. 

4. Systeme selon l'une des revendications 1 a 3, 
caracterise en ce que ladite bibliotheque de defauts 
subjectifs comporte des groupes de defauts pergus 
categorises et qualifies par une plurality d' utilisateurs 
de reference soumis a l'ecoute de signaux de parole de 
test affectes de pertes specif iques de paquets. 

5. Systeme selon la revendication 4, caracterise 
en ce que les groupes de defauts sont en outre soumis a 
une procedure de quantification de la gene pergue, 
permettant d'engendrer une grandeur de quantification de 
gene . 

6. Systeme selon l'une des revendications 1 a 5, 
caracterise en ce que lesdits moyens de detection de 
defauts presents sur ledit signal de parole reconstitue 
comportent au moins un module de detection, dans le signal 
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de parole reconstitute, des paquets perdus remplaces par du 
silence. 

7. Systeme selon l'une des revendications 1 a 6, 
caracterise en ce que lesdits moyens de detection de 
defauts presents sur ledit signal de parole reconstitue 
comportent en outre un module de detection de la 
decroissance de I'energie du signal de parole reconstitue, 
precedant le retnplacement par des trames de silence. 

8. Systeme selon l'une des revendications 1 a 7, 
) caracterise en. ce que lesdits moyens de detection de 

defauts presents sur ledit signal de parole reconstitue 
comportent en outre un module de localisation du defaut 
dans le corpus du signal de parole, dans un segment de 
parole ou dans un segment de silence. 
5 9. Systeme selon l'une des revendications 1 a 8, 

caracterise en ce que lesdits moyens de -calcul et 
d'affichage permettant d'afficher des parametres de 
qualite du signal de parole transmis comprennent au moins, 
pour tout type, de defaut detecte : 
20 - des moyens de calcul de 1 1 occurrence du defaut ; 

des moyens de calcul de la duree du defaut ; 
des moyens de conversion des parametres d 1 occurrence 
et de duree des defauts en un param^tre de qualite 
vocale pergue du signal de parole. 
25 10. Systeme selon la revendication 9, caracterise 

en ce que lesdits moyens de conversion des parametres 
d 1 occurrence de duree. des defauts en un parametre de 
qualite vocale perqaie du signal de parole comportent des 
moyens de calcul d'une fonction de ponderation de 
30 1' importance subjective des defauts objectifs detectes. 
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suivant leur emplacement temporel vis-a-vis du segment de 
parole. 

11. Procede de detection des defauts objectifs 
d'un signal de parole transmis par paquets en telephonie 
sur reseau de transmission par paquets, caracterise en ce 
qu'il consiste, a partir d 1 echantillons d'un signal de 
parole reconstitue representatif de ce signal de parole 
transmis et analyses sur au moins une fen§tre d' analyse : 
a calculer 1 ' energie moyenne du signal de parole 
reconstitue dans cette fenetre d* analyse ; 
a rechercher, pour une succession de fenetres 
d 1 analyse, les segments du signal de parole 
reconstitue a energie moyenne nulle ; et, sur 
existence d'au moins une fen§tre d ! analyse d' energie 
15 moyenne nulle, 

a valider la perte de paquets avec substitution par 
des trames de silence conditionnellement a 1' existence 
d ! une substitution de trame . 

12. Procede selon la revendication 11, caracterise 
en ce que I'etape consistant a valider la perte de paquets 
IP consiste : 

a calculer la pente de decroissance de 1 " energie 
d 1 excitation de trames anterieures successives ; 
a valider la perte de paquets en fonction de 
1 'existence d'un defaut objectif dans un segment 

d'activite vocale. 

13. Procede selon la revendication 11, caracterise 
en ce que l'etape consistant a valider la perte de paquets 
en fonction de 1" existence d'un defaut objectif dans un 
segment d'activite vocale consiste : 
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a calculer une valeur de changement de valeur de 
l'enveloppe du signal de parole reconstitue ; 
a comparer ladite valeur de changement a au moins une 
valeur de seuil, une ' reponse positive a ladite 
comparaison revelant 1 ' existence d ■ une perte de 
paguets dans un segment d'activite vocale engendrant 
un defaut subjectif et une reponse negative a ladite 
comparaison revelant 1 1 absence de defaut subjectif. 
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